事物空间(Thingspace)的簇状结构

The Cluster Structure of Thingspace

「构型空间(configuration space)」这一概念,是把对象的描述翻译成对象的位置的一种方式。你也许会觉得,蓝色离蓝绿色比离红色「更近」,但到底近多少?光盯着这些颜色看,很难回答。可如果你知道 RGB 中(按比例的)颜色坐标分别是 0:0:5、0:3:2 和 5:0:0,就会更有帮助;如果把它画在 3D 图上,那就更清楚了。

同理,你可以把一只知更鸟看作知更鸟——棕色的尾巴、红色的胸脯、标准的知更鸟体型、在不负重时的最大飞行速度、其物种典型的 DNA 以及个体的等位基因。或者,你也可以把这只知更鸟看作某个构型空间中的一个点:这个空间的各个维度描述了我们关于这只知更鸟所知道的(或可能知道的)一切。

知更鸟比病毒大,比航空母舰小——这也许就是「体积」维度。同样,知更鸟比氢原子重,比星系轻;这也许就是「质量」维度。不同的知更鸟在「体积」与「质量」之间会有很强的相关性,所以在这两个维度里,这些知更鸟点会排成一条相当线性的串——但这种相关性不会完全精确,因此我们确实需要两个彼此独立的维度。

这就是把知更鸟看作空间中的点的好处:如果你只是把知更鸟想象成可爱的小生物、扑扇着翅膀,你就没那么容易看出那条线性队列。

知更鸟的 DNA 是一个高度多维的变量,但你仍然可以把它看作知更鸟在事物空间中的位置的一部分——数百万个四元坐标,每个 DNA 碱基对应一个坐标——或者采用更精巧的表示方式。知更鸟的形状,以及它的颜色(表面反射率),同样也可以被视作它在事物空间中的位置的一部分,尽管它们并不是单一维度

正如坐标点 0:0:5 含有与真正的 HTML 颜色 blue 相同的信息一样,当我们把知更鸟看作空间中的点时,实际上不应丢失信息。无论我们把知更鸟想象成在天平上与一个 0.07 千克的砝码相对平衡,还是想象成一个质量坐标为 +70 的知更鸟点,我们对其质量所相信的陈述都应当是同一句话。

我们甚至可以想象一种构型空间:为对象的每一种不同特征都设置一个或多个维度,使得该空间中对象点的位置对应于真实对象本身的全部信息。它的表示也会相当冗余——维度里会同时包含质量、体积以及密度。

如果你觉得这太奢侈,量子物理学家会使用无限维的构型空间,而那个空间中的一个点就描述了宇宙中每一个粒子的位置。因此,相比之下,我们对事物空间的可视化其实更保守——事物空间中的一个点只描述一个对象,而不是整个宇宙。

如果我们不确定知更鸟的精确质量与体积,那么我们就可以在事物空间中想象一小团云——一个不确定性体积——知更鸟可能就在其中。云的密度就是我们相信知更鸟具有某个特定质量与体积的信念密度。如果你对知更鸟的密度比对它的质量与体积更确定,那么你的概率云会在密度维度上高度集中,并在质量/体积的子空间里围绕一条倾斜的线集中。(确实如此,这里的云其实是一张曲面,因为有关系式 V D = M。)

「辐射范畴」是认知心理学家用来描述词语那种非亚里士多德式边界的说法。核心的「母亲」会怀上自己的孩子,把孩子生下来,并抚养其成长。一个从不见自己孩子的捐卵者算母亲吗?她是「遗传母亲」。那一个被植入外来胚胎、并把孩子怀到足月的女人呢?她是「代孕母亲」。那一个抚养一个在遗传上并非她自己的孩子的女人呢?好吧,她是「收养母亲」。亚里士多德式三段论会这样运行:「人类有十根手指,Fred 有九根手指,因此 Fred 不是人类。」但我们实际的思维方式是:「人类有十根手指,Fred 是人类,因此 Fred 是一个『九指的人类』。」

我们也可以像上文那样,从内涵的角度来理解范畴的辐射性——某些性质通常会出现,但也可能缺失。如果我们思考「母亲」一词的内涵,它可能就像事物空间里一团弥散的光晕:光晕的强度与事物空间中某个体积与「母亲」这一范畴的匹配程度相对应。光晕在遗传、分娩与抚养这几个方面的中心区域最为集中;捐卵者所在的那一片体积也会发光,但亮度更弱。

或者,我们也可以从外延的角度来理解范畴的辐射性。假设我们用一种距离度量,把世界上所有的鸟都映射到事物空间中;这种距离度量尽可能对应人类感知到的相似性:一只知更鸟与另一只知更鸟的相似度高于它与一只鸽子的相似度,但知更鸟与鸽子彼此之间又都比它们与一只企鹅更相似,诸如此类。

那么,所有鸟类性的中心就会被许多彼此相邻、非常紧密的簇所密集占据:知更鸟、麻雀、金丝雀、鸽子,以及许多其他物种。鹰、隼和其他大型猛禽会占据附近的另一个簇。企鹅会处在更远的一个簇里;鸡和鸵鸟也同样如此。

其结果看起来确实可能有点像天文学意义上的星系团:许多星系绕着中心运行,外面还有少数离群值。

或者,我们也可以同时思考认知范畴「鸟」的内涵,以及现实世界中鸟类的外延:知更鸟与麻雀的中心簇以高度典型的鸟类性明亮发光;鸵鸟与企鹅的卫星簇以非典型的鸟类性较为昏暗地发光,而亚伯拉罕·林肯在几个百万秒差距之外,完全不发光。

我更喜欢最后那种可视化——发光的点——因为在我看来,认知内涵的结构是从外延的簇结构中衍生出来的:首先是世界中的结构,是鸟类在事物空间中的经验分布;然后,我们通过观察它,形成了一个范畴,其内涵的光晕大致覆盖在这套结构之上。

这又一次让我们看到,为什么词语不是亚里士多德式的类:真实宇宙的经验簇状结构并没有那么晶莹剔透。一个自然簇——一群彼此高度相似的事物——可能根本不存在任何一组必要且充分的性质——不存在任何一组特征能做到:所有成员都拥有,而所有非成员都不拥有。

但即便一个范畴已经模糊、崎岖到不可挽回,也没必要惊慌。要是有人说鸟是「有羽毛、会飞的东西」,我并不会反对。但企鹅不会飞!——好吧,没关系。常规规则有例外;这不是世界末日。无论如何,定义都不可能被期望与事物空间的经验结构完全一致,因为地图总是比领土更小、也更不复杂。「有羽毛、会飞的东西」这个定义的意义在于把听者引向鸟的那个簇,而不是把每一种现存鸟类一路描述到分子层面。

当你为一组在事物空间中经验上聚成簇的外延点画出边界时,你可能会发现:对你能发明的每一条简单内涵规则,至少都能找到一个例外。

但如果一个定义在实践中足以指出那个意图指向的经验簇,那么对它的反对就理直气壮地可以被称为「吹毛求疵」。